\chapter{最优化问题笔记}

\section{拉格朗日函数}
问题的表述

\begin{align*}
& Max\; F(x)\\
& s.t.\; G(x)=p_1x_1+p_2x_2
\end{align*}

其中，$x=(x_1,x_2)' $ 。

图形化；

回忆泰勒定理（泰勒展开），
\begin{equation}\label{eq1}
dF(x)=F_1(x)dx_1+F_2(x)dx_2
\end{equation}

类似地，对约束$G(x) $也有一个这样的变动，
\begin{equation}\label{eq2}
dG(x)=G_1(x)dx_1+G_2(x)dx_2
\end{equation}


现在我们假设这个最优点$x^*=(x_1^*,x_2^*) $ 已经找到。这个点至少应该具备这样一个性质，对于约束$ G(x) $而言，这样的一个点的变化不应该对$ G(x) $产生变化，即\eqref{eq2}式要等于0，
\[
G_1(x^*)dx_1=-G_2(x^*)dx_2
\]
如果令，
\[
G_1(x^*)dx_1=-G_2(x^*)dx_2=dc
\]
那么，就有，
\[
dx_1=\frac{dc}{G_1(x^*)},dx_2=\frac{dc}{G_2(x^*)}
\]
将上式代入\eqref{eq1}式，有，
\[
dF(x^*)=\left [\frac{F_1(x^*)}{G_1(x^*)}-\frac{F_2(x^*)}{G_2(x^*)}\right ]dc
\]
如果中括号里的式子不为0，那么只要选择dc与中括号里的式子同号，就可以使得F(x)增加。可见， 的另一个性质就是使得中括号里的式子为0，即
\begin{equation}\label{eq3}
\frac{F_1(x^*)}{G_1(x^*)}=\frac{F_2(x^*)}{G_2(x^*)}
\end{equation}
如果令，
\[
\frac{F_1(x^*)}{G_1(x^*)}=\frac{F_2(x^*)}{G_2(x^*)}=\lambda
\]
那么\eqref{eq3}式就可以写成两个方程，即，
\begin{equation}\label{eq4}
F_j(x^*)=\lambda G_j(x^*)\quad j=1,2
\end{equation}

以上是一种推导，为方便记忆，可以总结成一个拉格朗日定理，针对最优化函数和约束条件，定义一个拉格朗日函数，
\[
L(x,\lambda)=F(x)+\lambda[c-G(x)]
\]
记$L$的偏导为，
\[
L_j\equiv \frac{\partial L}{\partial x_j},L_{\lambda}\equiv \frac{\partial L}{\partial \lambda}
\]
那么，有，
\begin{align*}
& L_j(x,\lambda)=F_j(x)-\lambda G_j(x)\\
& L_{\lambda}(x,\lambda)=c-G(x)
\end{align*}

如果分别令$L_j=0,L_{\lambda}=0 $，那么上述第一个式子就是\eqref{eq4}式，第二个式子就是约束条件。这就是拉格朗日定理。

\vspace{2em}
可以扩展至多变量和多约束的情景中。譬如有$n$个选择变量$(x_1,x_2,\cdots,x_n) $，$m$个约束$G^i(x)=c_i,i=1,2,\cdots,m $，那么可以为每一个约束定义一个乘子$\lambda_i $，拉格朗日函数可以定义为，
\[
L(x_1,x_2,\cdots,x_n,\lambda_1,\lambda_2,\cdots,\lambda_m)=F(x_1,x_2,\cdots,x_n)+\sum_{i=1}^m\lambda_i[c_i-G^i(x_1,\cdots,x_n)]
\]
一阶必要条件则为，

\begin{align*}
& L_{x_j}(x,\lambda)=0,j=1,\cdots,n\\
& L_{\lambda_i}(x,\lambda_i)=c_i-G^i(x)=0,i=1,\cdots,m
\end{align*}


例：消费者在价格分别为$p$和$q$的两种商品$x$和$y$上进行选择，其收入为$I$，因此预算约束为，
\[I=px+qy\]

如果他的效用函数为
\[U(x,y)=\alpha\ln (x)+\beta\ln (y) \]

请问，他应该分别买多少$x$和$y$？

\section{包络定理}
研究的是参数对最优值的影响。

在最优值处，目标函数的值为$F(x^*) $，这个值实际上也是参数的函数，即可以定义，
\[V(\alpha)=F(x^*(\alpha),\alpha)\]
这个函数称为最大值函数。

首先，构造拉格朗日函数，
\[
L(x,\alpha;\lambda)=F(x,\alpha)-\lambda G(x,\alpha)
\]

此处，$\alpha $是参数。针对该拉格朗日函数的一阶条件为，
\begin{align*}
& \frac{\partial L}{\partial x_i}=F_i(x,\alpha)-\lambda G_i(x,\alpha)=0\\
& \frac{\partial L}{\partial \lambda}= G(x,\alpha)=0\\
\end{align*}

假设，已经得到了最优值$x^*=x^*(\alpha) $，那么针对最大值函数$V(\alpha)=F(x^*(\alpha),\alpha) $两边对参数求导，有，
\begin{equation}\label{eq5}
\frac{\partial V}{\partial \alpha}=\sum F_i\frac{\partial x^*_i}{\partial \alpha}+F_{\alpha}=\sum \lambda G_i\frac{\partial x^*_i}{\partial \alpha}+F_{\alpha}
\end{equation}

再来观察约束$G(x^*(\alpha),\alpha)=0 $，两边对$\alpha $求导，有，
\begin{equation}\label{eq6}
\sum G_i\frac{\partial x^*_i}{\partial \alpha}+G_{\alpha}=0
\end{equation}

将\eqref{eq6}式代入\eqref{eq5}式，可得，
\[ \frac{\partial V}{\partial \alpha}=F_{\alpha}-\lambda G_{\alpha}=L_{\alpha}(x^*,\alpha) \]
即参数 对最大值的影响，就等于拉格朗日函数直接对参数求偏导，并在最优解 处取值。

\section{最大值原理}
\subsection{推导}
一般有一个单期的目标函数如$F(y_t,z_t,t) $需要优化，该目标函数的特点就是它只依赖于当期变量，于是整个时间维度上的最优化可以表示为，
\begin{equation}\label{eq7}
\sum_{t=0}^T F(y_t,z_t,t)
\end{equation}
这类问题有一个很大的特点，就是变量区分为存量和流量两个维度。存量维度的一般称为状态变量，流量维度的称为控制变量，这些变量之间存在一个如下约束，
\begin{equation}\label{eq8}
y_{t+1}-y_t=Q(y_t,z_t,t)
\end{equation}

除此之外，我们还具有先前的一般约束，
\begin{equation}\label{eq9}
G(y_t,z_t,t)=0
\end{equation}

于是若记$ \mathcal{L} $为跨期问题的拉格朗日函数，那么
\begin{equation}\label{eq10}
\mathcal L=\sum_{t=0}^T \{F(y_t,z_t,t) +\pi_{t+1}[y_t+Q(y_t,z_t,t)-y_{t+1}]-\lambda_tG(y_t,z_t,t)\}
\end{equation}

$\mathcal L $中的变量包括$y_t,z_t,\lambda_t,\pi_{t+1} $。实际上，我们的问题在于选择$y_t,z_t $来使目标函数最大化，关于$z_t $（ $t=0,1,\cdots,T $）的一阶条件非常简单，
\begin{equation}\label{eq11}
\frac{\partial \mathcal L}{\partial z_t}\equiv F_z(y_t,z_t,t)+\pi_{t+1}Q_z(y_t,z_t,t)-\lambda_tG_z(y_t,z_t,t)=0
\end{equation}

关于$y_t $的一阶条件略显复杂，譬如因为$y_1 $出现在了$F,Q$和$G$中，于是在$t=1$的时候有$\pi_2y_1 $项，实际上在$t=0$的时候，又有$-\pi_1y_1 $项，这样的话，求导会很麻烦。但可以重新整理\eqref{eq10}式，使得每一个$y_t $只出现在一项中。取\eqref{eq10}式中我们所关注的一部分，
\begin{align*}
\sum_{t=0}^T \pi_{t+1} & (y_t-y_{t+1})\\
& = \pi_1(y_0-y_1)+\pi_2(y_1-y_2)+\cdots+\pi_{T+1}(y_T-y_{T+1})\\
& = y_0\pi_1+y_1(\pi_2-\pi_1)+\cdots+y_T(\pi_{T+1}-\pi_T)-y_{T+1}\pi_{T+1}\\
& = \sum_{t=0}^Ty_t(\pi_{t+1}-\pi_t)+y_0\pi_1-y_{T+1}\pi_{T+1}
\end{align*}

于是\eqref{eq10}式就可以写成，
\begin{align*}
\mathcal L= & \sum_{t=0}^T \{F(y_t,z_t,t) +\pi_{t+1}Q(y_t,z_t,t)+y_t(\pi_{t+1}-\pi_t)-\lambda_tG(y_t,z_t,t)\}\\
& +y_0\pi_1-y_{T+1}\pi_{T+1}
\end{align*}

大括号外的只跟$y_0,y_{T+1} $有关，而它们又不是选择变量（第一个不用选择，最后一个没必要选择）。因此，关于$y_t $（ $t=0,1,\cdots,T $)的一阶条件为，
\[
\frac{\partial \mathcal L}{\partial y_t}\equiv F_y(y_t,z_t,t)+\pi_{t+1}Q_y(y_t,z_t,t)+\pi_{t+1}-\pi_t-\lambda_tG_y(y_t,z_t,t)=0
\]
也即，
\begin{equation}\label{eq12}
\pi_{t+1}-\pi_t=-[F_y(y_t,z_t,t)+\pi_{t+1}Q_y(y_t,z_t,t)-\lambda_tG_y(y_t,z_t,t)]
\end{equation}
该式最为关键。

\subsection{记忆}
为方便记忆，定义汉密尔顿函数，
\begin{equation}\label{eq13}
H(y_t,z_t,\pi_t,t)=F(y_t,z_t,t)+\pi_{t+1} Q(y_t,z_t,t)
\end{equation}

从对控制变量的求解\eqref{eq11}式来看，它也隐含在汉密尔顿函数的框架下，它表明的是在时刻$t$选择控制变量$ z_t $，在\eqref{eq9}式约束下最大化汉密尔顿函数。我们将这个最大值记为$H^*(y_t,\pi_{t+1},t) $。

现在又可以回到单期最优化问题的拉格朗日函数中，定义拉格朗日函数$L$，
\[
L=H(y_t,z_t,\pi_{t+1},t)-\lambda_tG(y_t,z_t,t)
\]
该式的一阶条件就是\eqref{eq12}式，也即
\begin{equation}\label{eq14}
\pi_{t+1}-\pi_t=-L_y(y_t,z_t,\pi_{t+1},t)
\end{equation}
在这个单期优化问题里，只有$ z_t $是选择变量，其他都是参数，那么回忆包络定理，\eqref{eq14}式也意味着
\begin{equation}\label{eq15}
\pi_{t+1}-\pi_t=-H_y^*(y_t,\pi_{t+1},t)
\end{equation}
作为一种对称，\eqref{eq8}式也可以写成，
\begin{equation}\label{eq16}
y_{t+1}-y_t=H_{\pi}^*(y_t,\pi_{t+1},t)
\end{equation}

现在来总结一下，以形成最大值原理。

在约束\eqref{eq8}式和\eqref{eq9}式下，最大化\eqref{eq7}式的一阶必要条件满足：
\begin{enumerate}
	\item 在单期约束$G=0 $下最大化汉密尔顿函数，即\eqref{eq11}式。
	\item 差分方程\eqref{eq15}式和\eqref{eq16}式决定了$y_t,\pi_t $的时间维度变化。	
\end{enumerate}

\subsection{横截条件}
一项资产在最后如果有剩余，说明它没有价值。如果没有剩余，说明有价值。即
\[
y_{T+1}\ge 0,\pi_{T+1}\ge 0
\]

满足互补松弛条件。这种关于终端存量和他们影子价格的条件通常称为横截条件。

往连续时间的推广
对应\eqref{eq7}式的目标函数可以写为，
\[
\int_0^T F(y_t,z_t,t)dt
\]

然后定义汉密尔顿函数如\eqref{eq13}式相同，那么最大值原理依然成立，第一个条件即$z_t $在约束$G=0 $下最大化$H$。同时在变量上方加一个点表示该变量对时间求导，那么对应\eqref{eq15}式和\eqref{eq16}式的一阶条件即为，
\[
\dot{y}=H^*_{\pi}(y_t,\pi_t,t)
\]
\[
\dot \pi=-H^*_y(y_t,\pi_t,t)
\]


\subsection{例题}
例：一个寿命为T的工人，生命期间将赚取常数w的工资，该储蓄有常数r的利率，所以当他的资本存量为k时，他收入的流量就是w+rk。如果他的消费是c，那么他资本积累就由下式决定，
\[
\dot k=w+rk-c
\]

状态变量是k,控制变量是c。如果他没有遗产也没有遗赠，即终端条件是
\[
k(0)=k(T)=0
\]

如果瞬时效用函数是$\ln c $，效用折现率是$\rho $，那么最大化的目标为，
\[
\int_0^T \ln c\cdot e^{-\rho t}dt
\]

对于该问题，可以定义汉密尔顿函数，
\[
H=\ln c\cdot e^{-\rho t}+\pi(w+rk-c)
\]

首先，关于控制变量的条件为
\begin{equation}\label{eq17}
c^{-1}e^{-\rho t}-\pi=0
\end{equation}

于是最大化的汉密尔顿函数为，
\[
H^*=-(\ln \pi+\rho t)e^{\rho t}+\pi(w+rk)-e^{\rho t}
\]

于是关于k和$ \pi $ 的微分方程为，
\[
\dot k=\frac{\partial H^*}{\partial \pi}=w+rk-\pi^{-1}e^{-\rho t}
\]
\begin{equation}\label{eq18}
\dot \pi=-\frac{\partial H^*}{\partial k}=-r\pi
\end{equation}

\eqref{eq18}式的通解是显然的，
\begin{equation}\label{eq19}
\pi=\pi_0e^{-\rho t}
\end{equation}

$\pi_0 $是一个常数，一般通过横截条件求出。

若将\eqref{eq19}式代入\eqref{eq17}式，也可以发现一些特征事实，
\[
c=\pi_0^{-1}e^{(r-\rho)t}
\]

当$r>\rho $ 时，消费是不断增长的。这意味着在生命早期是$c<w $，在晚期则是$c>w $。



